草庐IT

python - Jinja2 异常处理

全部标签

python - 使用 lxml 解析 DTD 时出错

我正在尝试编写一个验证脚本来根据NITFDTD验证XML,http://www.iptc.org/std/NITF/3.4/specification/dtd/nitf-3-4.dtd.基于thispost我提出了以下简单脚本来验证NITFXML文档。Bellow是我在运行脚本时收到的错误消息,它不是很具有描述性并且很难调试。感谢您的帮助。#!/usr/bin/envpythondefmain():fromlxmlimportetree,objectifyfromStringIOimportStringIOf=open('nitf_test.xml')xml_doc=f.read()f

xml - 处理(太多)许多 XML 文件(使用 TagSoup)

我有一个包含大约4500个XML(HTML5)文件的目录,我想为它们的数据创建一个“list”(本质上是title和base/@href).为此,我一直在使用一个函数来收集所有相关文件路径,用readFile打开它们,将它们发送到基于tagsoup的解析器,然后输出/格式化结果列表。这适用于文件的子集,但最终会遇到openFile:resourceexhausted(Toomanyopenfiles)错误。阅读一些内容后,这并不奇怪:我正在使用mapMparseMetaDataFile文件,它会立即打开所有句柄。我想不通的是如何解决这个问题。我试过阅读一些关于Iteratee的文章;我

ruby-on-rails - 在 Rails 中处理 JSON 或 XML

我正在通过HTTPPost将JSON数据上传到Rails应用程序。我是Rails新手,我不明白如何在我的Rails应用程序的Controller中处理json或xml。我可以找到处理表单数据的信息,但没有发布json或xml。请指导我阅读解决此问题的书籍、教程、指南或代码。谢谢。 最佳答案 只要您在HTTPPost中正确设置了内容类型header,任何XML或JSON都应该被自动解析并放置在params散列中在操作中可用(在Controller中)。例如,如果您将其放在内容正文中:{'name':'John','occupation

python - 使用带有转义字符作为参数的 XML 使用 WSDL url

我正在执行一个SOAPWeb服务的方法,该方法使用suds库接收3个字符串参数。第一个字符串参数应该是一个XML,另外两个是用户名和密码,这是我的半工作实现。fromsuds.clientimportClienturl="http://www.jonima.com.mx:3014/sefacturapac/TimbradoService?wsdl"client=Client(url)client.service.timbrado(XML_AS_STRING_HERE,'PRUEBA1','12345678')当第一个参数包含转义字符(&符号、引号、撇号、小于、大于)时,方法不起作用,因

c# - 异常 : Text node cannot appear in this state

在MonoDevelop中编辑xml并使用dotNET加载它后,我的应用程序中有时会出现错误“文本节点无法出现在此状态”。这个错误真的很烦人,因为我必须将XML文件复制到Windows并尝试用VS修复它。xml文件绝对正确,一定是有编码的东西。在MonoDevelop中有什么快速的方法可以解决这个问题吗?当然,为什么会出现这个错误会很有趣。编辑(应要求提供简短的XML示例) 最佳答案 我试图重现这个问题,但我发现(鉴于我人为的重现)我所要做的就是编辑xaml的第一行看起来,当编码改变时,之前有一个空格。文件中的节点。我使用TextW

python - 下载没有 Python unicode 错误的 html

我正在尝试将page_source下载到文件中。但是,每次我得到:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc2(orsomethingelse)inposition8304:ordinalnotinrange(128)我试过使用value.encode('utf-8'),但似乎每次它都会抛出相同的异常(除了手动尝试替换每个非ascii字符之外).有没有办法“预处理”html以将其转换为“可写”格式? 最佳答案 有第三方库如BeautifulSoup和lxml可以自动处理编码问题

python - 有什么方法可以知道 ElementTree DOM 消耗了多少内存?

假设您执行以下操作:dom=ElementTree()dom.parse(some_file_path)我想记录这个dom现在在我的进程中使用的粗略内存量。我不需要精确的东西,粗略的东西就可以了。我认为我无法从源XML文件的大小中得出它。我有一个500KB的文件,如上例所示,它在加载python进程后似乎增加了大约5MB的内存使用量。我查看了ElementTreeAPI,没有看到任何提供此信息的API。有人知道在解析/加载XML文件后了解ElementTree实例使用了多少内存的方法吗? 最佳答案 本质上,您想要查找特定python

java - XML 处理 - 性能问题

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion我有一个大约10mb大小的xml文档。它具有相对简单的结构,但其中包含大量二进制数据。我需要从中获取数据并将其保存在数据库中。尝试过jaxbmetro-工作真的很慢。我目前正在为此尝试使用jibx,但解码几个xml文档会使用所有jvm内存-堆空间错误-数据库已损坏。也许我应该用别的东西来阅读xmls?请给点建议。编辑我的xml表示某种消息,包含“to”、“from”等

python - BeautifulSoup XML 仅打印第一行

我正在使用BeautifulSoup4(和lxml)解析XML文件,出于某种原因,当我打印soup.prettify()时它只打印第一行:frombs4importBeautifulSoupf=open('xmlDoc.xml',"r")soup=BeautifulSoup(f,'xml')printsoup.prettify()#>>>知道为什么它没有抓取所有内容吗?更新:test 最佳答案 文件位置在EOF:>>>soup=BeautifulSoup("",'xml')>>>soup.prettify()'\n'或者内容不是有效

Python ElementTree find() 在 kml 文件中不匹配

我正在尝试使用元素树从kml文件中查找元素,如下所示:fromxml.etree.ElementTreeimportElementTreetree=ElementTree()tree.parse("history-03-02-2012.kml")p=tree.find(".//name")该文件的足够子集如下所示:Locationhistoryfrom03/03/2012to03/10/2012“名称”元素存在;为什么搜索结果是空的? 最佳答案 您尝试匹配的name元素实际上位于KML命名空间内,但您并未考虑该命名空间进行搜索。尝试